# clean_question.py
# usage:
# python ./src/tools/clean_question.py --query "请问2023年1月10日至2024年11月26日人工接通总量是多少单"

import os,sys
# 添加项目根目录到路径
project_root = os.path.abspath(os.path.join(os.path.dirname(__file__), '..'))
sys.path.insert(0, project_root)

import re
import argparse
from tools.clean_value import clean_text

def clean_question(question: str) -> str:
    """
    删除时间相关的描述
    """
    # 精确匹配开头的日期前缀
    pattern = r"(?:请问|请问在|查询|请查询|请查询在|查询在|在)?(?:\d{4}年)(?:\d{1,2}月(?:\d{1,2}日)?|\d{1,2}月|第[1-4]季度)?(?:至\d{4}年(?:\d{1,2}月(?:\d{1,2}日)?|\d{1,2}月)?)?(?:中?的?，?)?"
    question_cleaned = re.sub(pattern, "", question)
    question_parameter = clean_text(question_cleaned)
    return question_parameter.strip()


def main():
    parser = argparse.ArgumentParser(description="清洗问题后精确匹配表名")
    parser.add_argument('--query', type=str, required=True, help='输入的问题')

    args = parser.parse_args()
    print(clean_question(args.query))


if __name__ == '__main__':
    main()